1
Enquête complète ou échantillonnage ? — Première étape vers une enquête statistique
MATH701B-PEP-CNLesson 6
00:00
ÉchantillonnageEstimationPopulationÉchantillon
La statistique est la science qui étudie comment collecter, organiser et analyser des données afin d'en tirer des inférences et de prendre des décisions. Comme goûter un bol de congee aux cinq saveurs, vous n'avez pas besoin de le vider entièrement pour savoir s'il est sucré ou salé. Il suffit de bien mélanger, puis de prélever une cuillerée, pour « voir une partie et en déduire le tout ». C'est là toute la magie des enquêtes statistiques.

Concepts clés : Qui est notre protagoniste ?

Avant toute enquête, nous devons définir clairement notre objet d'étude :

  • Population (Population): L'ensemble total des éléments à étudier.
  • Individu: Chaque élément composant la population.
  • Échantillon (Échantillon): Une partie extraite de la population.
  • Taille de l'échantillon (Taille de l'échantillon): Le nombre d'individus contenus dans l'échantillonnombre(Attention : il s'agit d'un nombre, sans unité).

Choix de la méthode d'enquête

Pourquoi ne pas toujours effectuerune enquête complète(une enquête sur tous les éléments) ?

Scénario A : Recensement

Par exemple, le sixième recensement national de 2010. Une précision extrême est exigée, et les données concernent l’économie nationale et le bien-être des citoyens ; il faut absolument que personne ne soit omis.

Scénario B : Test de résistance aux chocs

Si l'on souhaite évaluer la résistance au choc d'une série de voitures, une enquête complète signifierait détruire toutes les voitures neuves. Dans ce cas,l'échantillonnage(extraire une partie des objets pour l'enquête et inférer les caractéristiques de l’ensemble) est la seule option possible.

Scientificité et pièges de l'échantillonnage

Pour garantir qu'une cuillerée représente bien le bol entier, il faut respecter le principe deéchantillonnage aléatoire simpleprincipe, assurant à chaque individu une chance égale d'être sélectionné. Nous devons éviter les trois pièges suivants :

  • Trop petit : Une taille d'échantillon trop petite entraîne une forte variabilité aléatoire et ne permet pas de refléter objectivement la population.
  • Trop grand : On perd l'avantage de gagner du temps et de l'effort.
  • Biais : Par exemple, ne sonder que ses camarades proches pour estimer les résultats de l'école entière : l'échantillon n'est pas représentatif.
🎯 Logique fondamentale
Le cœur de l'échantillonnage réside dans l'utilisation des données de l'échantillon pour inférer les caractéristiques de la population. Sa formule logique est : $q \approx \frac{p}{n} \times m$, où $q$ est l'estimation de la population.